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基于 分 布 式 压缩 感知 和 散 列 函数 的 数据 融合 隐私 保护 算法 ， 
寇 兰 , 刘 宁 ， 黄 宏 程 ， 张 ” 艳 


(重庆 邮电 大 学 通信 与 信息 工程 学 院 , 重庆 400065) 


摘 要 : 针对 群 智 感 知 网 络 数据 融合 传输 过 程 中 隐私 泄露 、 信 息 不 完整 、 数 据 窜改 等 安全 问题 ， 提 出 了 一 种 基于 分 布 
式 压 缩 感知 和 散 列 函数 的 数据 融合 隐私 保护 算法 。 首 先 ， 采 用 分 布 式 压缩 感知 方法 对 感知 数据 进行 稀 路 观 测 ， 去 除 宛 
余数 据 ; 其 次 ， 利 用 单 向 散 列 函 数 求 取 感 知 数据 观测 值 的 散 列 值 ， 将 其 和 不 受 限 的 伪装 数据 一 起 填充 到 感知 数据 观测 
值 中 ， 达 到 隐藏 真实 感知 数据 的 目的 ; 最 后 ， 在 汇聚 节点 提取 伪装 数据 之 后 ， 再 次 获取 感知 数据 的 散 列 值 并 验证 数据 
的 完整 性 。 仿 真 结 果 表明 ， 该 算法 兼顾 了 数据 的 机 密 性 和 完整 性 保护 ， 同 时 大 大 降低 了 通信 开销 ， 在 实际 应 用 中 具有 
很 强 的 适用 性 和 可 扩展 性 
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Data aggregation privacy protection algorithm based on 
distributed compressive sensing and hash function 


Kou Lan, Liu Ning, Huang Hongcheng, Zhang Yan 
(School of Communication & Information Engineering, Chongqing University of Posts & Telecommunications, Chongqing 


400065, China) 


Abstract: Aiming at the security problems existing in the process of the data aggregation and transmission in crowd sensing 
networks, such as privacy leakage, incomplete information, data tampering. this paper proposed a data aggregation privacy 
protection algorithm based on distributed compressive sensing and hash function. Firstly, it used distributed compressive sensing 
method to sparsely observe the sensed data and remove the redundant data. Then, it utilized one-way hash function to obtain 
hash value of the observation data and filled the hash value with the unconstrained camouflage data into the observation data of 
sensory data to reach the aim of concealing the true sensor data. Finally, after extracting the camouflage data at the sink node, it 
obtained the hash value of the observation data again to verify the integrity of data. Simulation results show that the algorithm 
takes into account the privacy preserving and integrity protecting of data, and also can reduce the communication overhead 
greatly, which means the strong applicability and scalability in practical applications. 
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引言 
群 智 感知 是 以 普通 用 户 的 移动 设备 〈 如 智能 手机 、 智 能 手 ， 布 的 较为 密集 ， 每 个 感知 节点 收 引 
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知 网 络 成 为 检测 交通 、 地 震 和 健康 等 信息 的 新 型 手段 让。 
在 一 些 热点 区 域 〈 比 如 商场 、 办 公 区 域 等 ) ， 感 知 节点 分 
的 数据 与 其 他 节点 不 可 避免 
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表 、 平 板 电 脑 等 ) 做 为 基本 感知 单元 ， 通 过 系统 互联 网 进行 有 ”的 存在 较 强 的 时 空 相 关 性 。 如 果 将 原始 感知 数据 直接 传输 到 汇 
意识 和 无 意识 的 协作 , 进行 感知 任务 的 分 发 .感知 数据 的 收集 ， 聚 节点 ， 那 么 对 于 元 余 感知 数据 的 不 必要 传输 将 会 极 大 的 增加 
完成 复杂 和 大 规模 的 社会 感知 任务 0]。 相 比 于 传统 的 传感器 网 ”感知 网 络 的 资源 消耗 9。 而 且 ， 人 们 往往 只 关心 感知 数据 的 有 
络 需 要 针对 某 一 感知 任务 专门 部 署 大 量 的 传感器 节点 ， 群 智 感 ” 效 信息 ， 并 不 需要 大 量 的 原始 感知 数据 。 因 此 ， 对 原始 感知 数 
知 网 络 可 以 直接 利用 用 户 随 身 携带 的 移动 终端 和 现 有 的 通信 和 链 、 ” 据 压 缩 融合 后 传输 ， 不 仅 可 以 极 大 程度 的 降低 感知 数据 传输 过 
路 来 构建 ， 低 成 本 实现 大 规模 和 细 粒 度 的 感知 任务 。 因 此 ， 群 。” 程 中 的 资源 消耗 ， 而 且 可 以 精确 地 提取 原始 海量 感知 数据 的 特 
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征 ， 提 高 感知 平台 对 感知 数据 的 收集 效率 。 但 是 ， 无 线 传 输 链 “” 论 ` 匿 名 认证 思想 和 茫然 传输 协议 与 传统 的 公 钥 密码 算法 相 比 ， 
路 的 不 可 靠 性 和 融合 节点 的 不 可 信 性 使 得 感知 数据 容易 受到 对 大 幅度 降低 了 算法 的 计算 复杂 度 。 文 献 [14] 基 于 安全 多 方 计算 
手 窜改 、 窃 听 、 重 播 、 或 注入 虚假 数据 等 ， 严 重 威胁 了 感知 数 的 思想 ， 对 分 复数 据 融合 隐私 保护 算法 进行 改进 ， 复 头 选择 协 
据 的 安全 外。 因此, 研究 群 智 感知 网 络 中 的 隐私 保护 , 尤其 是 在 作 节 点 配合 完成 隐私 数据 融合 工作 ， 大 大 降低 了 计算 量 和 通信 
数据 融合 阶段 对 感知 数据 的 机 密 性 和 完整 性 保护 ， 有 具有 重要 的 
研究 意义 。 为 了 兼顾 感知 数据 的 机 密 性 和 完整 性 保护 ， 文 献 [15] 提 出 
1 相关 工人 作 了 隐私 数据 融合 的 完整 性 保护 算法 Cintegrity-protecting private 
data aggregation, iPD A ) 通过 数据 切片 和 组 装 计算 来 实现 数据 融 
至 今 已 有 不 少 文献 对 群 智 感知 网 络 数据 融合 传输 过 程 中 的 合 过 程 中 的 隐私 保护 ， 构 建 两 颗 融 合 树 ， 并 通过 其 中 一 颗 用 来 
隐私 保护 进行 了 研究 。 文 献 [3] 提 出 了 一 种 轻 量 级 的 定向 数据 融 。” 监督 融合 结果 是 否 完整 。 但 是 该 算法 只 对 部 分 攻击 有 效 ， 例 如 
合 方案 ， 基 于 距离 生成 网 络 拓 扑 结构 ， 以 平衡 簇 头 的 能 耗 ， 对 于 攻击 者 同时 窜改 两 棵 树 融 合 结果 时 的 攻击 ， 该 算法 便 无 法 
节点 的 私有 因子 和 原始 数据 组 成 复数 结构 ， 并 通过 加 性 同 态 加 检测 出 。 文 献 [16] 提 出 了 一 种 可 检测 数据 完整 性 的 隐私 数据 融 
密 方法 加 密 ， 实 现 了 数据 融合 且 不 需要 任何 解密 ， 该 方案 既 保 合算 法 (integrity- checking private data aggregation, ICKPDA ) ， 
证 了 数据 融合 时 的 隐私 保护 性 能 又 降低 了 计算 开销 。 文献 [6]1 该 算法 通过 将 密 钥 填 充 在 感知 数据 中 ， 并 将 填充 密 钥 后 的 数据 
出 了 一 种 基于 信任 的 数据 融合 协议 ， 通 过 对 节点 行为 的 观察 ， 进行 切片 对 感知 数据 进行 隐私 保护 ， 利 用 密 钥 之 间 的 关联 性 对 
协议 计算 、 监 视 和 评估 节点 的 信任 值 ， 及 时 检测 和 排除 受 损 节 ” 切片 在 汇聚 节点 的 重组 数据 进行 完整 性 验证 。 该 算法 一 定 程度 
点 ,该 方案 能 够 有 效 的 降低 节点 能 耗 并 提升 数据 传输 的 可 靠 性 。 上 兼顾 了 数据 机 密 性 和 完整 性 ， 但 是 产生 了 较 大 的 通信 开销 。 
文献 [7] 通 过 使 用 简单 的 技术 共享 数据 的 加 密 内 容 但 是 不 向 其 感知 数据 在 融合 传输 时 ， 应 兼顾 感知 数据 的 机 密 性 和 完整 
他 节点 显示 真实 数据 和 密 钥 ， 基 站 识别 融合 节点 复 内 相关 的 不 “人性 保护 ， 同 时 需要 尽量 降低 通信 开销 以 满足 实际 场景 的 应 用 。 
信任 节点 ,并 且 仅 对 异常 感知 数据 的 中 间 节 点 进行 数据 的 重 传 ， 现 有 的 隐私 保护 方法 大 都 以 数据 的 机 密 性 保护 为 中 心 ， 忽 略 了 
该 方案 中 由 于 中 间 节 点 不 需要 逐 跳 进行 加 密 解密 操作 ， 计 算 开 感知 数据 的 完整 性 ， 而 能 够 兼顾 数据 机 密 性 和 完整 性 的 隐私 保 
销 减 小 ， 中 间 融 合 节 点 不 知道 感知 数据 的 真实 内 容 ， 可 以 有 效 。” 护 方案 通信 开销 较 大 ， 为 了 解决 这 个 问题 ， 本 文 提 出 一 种 基于 
抵御 内 部 攻击 。 分 布 式 压缩 感知 和 散 列 函数 的 数据 融合 隐私 保护 算法 (data 
文献 [8] 提 出 了 基于 分 簇 的 隐私 保护 数据 融合 方法 ,根据 汇 aggregation privacy-preserving algorithm based on distributed 
聚 节点 的 指令 ， 感 知 节点 将 生成 的 受 限 伪 装 数据 和 不 受 限 制 的 compressed sensing and hash function, DAP-DCSHF ) ， 采 用 分 布 
伪装 数据 共同 填充 到 感知 数据 观测 信 的 对 应 位 ， 该 方法 加 强 。” 式 压缩 感知 对 原始 感知 数据 进行 稀疏 和 观测 ， 降 低 网 络 的 通信 
了 对 数据 的 隐私 保护 性 能 。 文 献 [9] 针 对 分 布 式 智能 电表 数据 提 开销。 采用 单 向 散 列 函数 对 稀疏 观测 值 求 散 列 值 ， 并 将 散 列 值 
出 了 基于 傅 里 叶 扰 动 算法 和 小 波 扰动 算法 的 数据 融合 隐私 保护 和 根据 隐私 保护 需求 随机 生成 的 不 受 限 伪 装 数据 一 起 填充 在 观 
数据 系统 , 利用 指数 ELGamal 加 密 机 制 实现 用 户 和 汇聚 节点 之 测 值 的 零 值 位 置 ， 增 强 感 知 数据 的 机 密 性 保护 。 将 散 列 值 和 不 
间 的 安全 通信 ， 其 中 的 分 布 式 差分 隐私 机 制 依据 高 斯 原理 生成 受 限 伪 装 数据 的 填充 位 置信 息 单独 加 密 发 送 给 汇聚 节点 ， 最 后 
分 布 式 噪声 ， 与 传统 的 隐私 保护 系统 相 比 ， 保 证 了 每 个 用 户 的 汇聚 节点 将 收 到 的 隐私 保护 数据 集中 的 伪装 数据 剔除 后 ， 再 次 
差异 隐私 ,但 是 该 方案 对 于 其 他 类 型 的 感知 数据 不 具备 适用 性 。 利用 散 列 函数 求 取 散 列 值 ， 通 过 比较 两 次 散 列 值 是 否 一 致 ， 验 
为 了 保护 感知 数据 的 隐私 ， 同 时 以 较 低 的 通信 开销 对 数据 证 感知 数据 的 完整 性 。 


进行 融合 ， 文 献 [10] 提 出 了 基于 分 布 式 压缩 感知 的 隐私 保护 数 
m i , 2 基于 分 布 式 压缩 感知 和 散 列 函数 的 数据 融合 隐私 
据 融 合算 法 〈distributed compressed sensing-based privacy- 保护 算法 
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preserving data aggregation mechanism, DCSPDA) ， 利 用 分 布 式 

压缩 感知 对 原始 的 感知 数据 进行 压缩 和 观测 ， 以 较 小 的 通信 开 本 文 提出 基于 分 布 式 压缩 感知 和 散 列 函 数 的 数据 融合 隐私 
销 实现 了 感知 数据 的 隐私 保护 ， 但 是 缺乏 考虑 数据 的 完整 性 验 。 保护 算法 ， 在 基于 分 布 式 压缩 感知 的 隐私 保护 数据 融合 算法 
证 。 文 献 [11] 引 入 正 负 对 来 混淆 真实 感知 数据 , 并 通过 混淆 因子 (DCSPDA) 的 基础 上 进行 改进 ， 利 用 单 向 散 列 函 数 对 稀疏 观 
确定 传感器 需要 产生 的 正 负 对 数量 ， 在 数据 融合 阶段 ， 采 用 正 。” 测 值 求 散 列 值 ， 将 散 列 值 作为 受 限 伪装 数据 填充 在 观测 值 的 零 
负 中 和 策略 和 时 间 片 分 配 机 制 ， 降 低 了 通信 开销 和 碰撞 率 ,， 但 。 值 位 置 ， 在 汇聚 节点 处 对 接收 到 的 隐私 数据 集 吻 除 伪装 数据 后 
是 仍 缺 乏 对 感知 数据 的 完整 性 保护 。 再 次 求 取 散 列 函数 值 ， 既 增强 了 感知 数据 的 机 密 性 保护 ， 又 验 
基于 安全 多 方 计算 的 协议 使 节点 交换 种 子 并 进行 联合 计算 ， ”证 了 完整 性 ， 同 时 也 降低 了 数据 融合 传输 过 程 中 的 通信 开销 。 
有 效 保护 了 数据 的 隐私 ， 但 是 在 种 子 交 换 过 程 中 ， 计 算 量 和 通 。 2.1 感知 数据 的 分 布 式 压缩 观测 方法 

信和 量 随 着 涉及 的 节点 数量 而 增加 U3。 文献 [13] 提 出 了 一 种 基于 分 布 式 压缩 感知 (distributed compressed sensing,DCS ) 是 一 
安全 多 方 计算 的 车 载 网 隐私 保护 方案 ， 通 过 结合 线性 方程 组 理 。 种 利用 感知 数据 之 间 的 时 空 相关 性 ， 对 感知 数据 进行 高 效 压缩 
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编码 端 7 
都 能 进行 联合 解码 ， 都 可 以 得 到 相等 的 信息 量 07。 
的 分 布 式 压缩 观测 阶段 ， 首 先 将 感知 节点 收 各 
布 式 压缩 观测 。 
建立 能 够 描述 、 处 理 感 知 数据 的 分 布 式 压缩 感知 联合 稀 玻 
FE JSM) ， 在 融合 节点 将 附近 通信 范围 内 多 个 感知 节点 收 
集 到 的 原始 多 媒体 感知 数据 进行 分 布 式 压缩 感知 观测 : 
X, 2 V0, - Z, « Z, , je{l, 2, J} (1) 
其 中 : J 为 融合 节点 附近 通信 禾 盖 范围 内 的 感知 节点 的 个 数 ; 
09; 为 节点 j 感 知 数 据 的 稀 玻 系数 ，Y 为 Vx N UEA HFR E: 
Zc 为 感知 数据 的 公共 稀 疏 成 分 ，2; 分 别 为 感知 数据 的 独 
SERUUM A) o 


在 分 布 式 信 源 编码 中 ， 
论 是 独立 编码 还 是 联合 编码 ， 经 过 传输 后 ， 在 解码 端 
在 感知 数据 
到 的 数据 进行 分 
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Z,-V8, , I &- l= Ke Q) 
Z;-V6,. 18h54 Q) 


其 中 : X (2) (3) 分 别 表示 原始 感知 数据 A LC S TERRA 
Ze, WIMI Z TERRE V EXE Kos K LBS. 
采用 二 进 制 随机 观测 矩阵 对 感知 数据 进行 稀疏 观测 : 
y= €x," OY (0, +0,) 
y= €,x,- OW (O, +0,) 


(4) 


y= 9x,- 0," (8, *6,) 


其 中 ;性 为 原始 多 媒体 感知 数据 的 M x1 维 分 布 式 压缩 感知 观 
测 值 向 量 ，9; 为 M x N 维 稀 朴 二 进 制 随机 观测 矩阵 ， 加 为 j 节 
点 的 Nxl 原始 感知 数据 ，Y% 为 Nx N 维 公共 稀疏 基 ，@- 为 7 
节点 的 公共 稀疏 系数 ， 8) 为 独立 稀疏 系数 。 
观测 过 程 实际 就 是 利用 M x N 维 稀疏 二 进 制 随机 观测 和 
阵 0; 的 M. 个 行 向 量 对 稀 政 系数 向 量 进行 投影 ， 保 留 了 信 
构 所 需 的 信息 。 原 始 多 媒体 感知 数据 观测 值 的 位 置 集合 用 
NTPS 表示 。 
2.2 感知 数据 的 机 密 性 保护 
单 向 散 列 函 数 ， 又 称 单 向 hash BR 
信息 串 转换 为 固定 长 度 的 输出 串 并 且 由 输出 串 难 以 逆向 求解 得 
到 输入 信息 串 的 一 种 函数 。 本 文采 用 MDS 单 向 散 列 函数 ， 访 
函数 把 任意 长 度 的 输入 信息 串 转换 为 32 位 的 输出 串 ， 对 分 布 
式 压缩 感知 观测 数据 利用 MDS 单 向 散 列 函 数 求 散 列 值 : 
H; - hash(y,) 6) 
其 中 : Hs Js it 18 e ABIA AHE, Ys 为 输入 的 
原始 多 媒体 感知 数据 观测 值 。 
原始 多 媒体 感知 数据 的 分 布 式 压缩 感知 观测 值 由 公共 稀 琉 
部 分 、 独 立 稀疏 部 分 、 零 值 部 分 三 部 分 组 成 ， 定 义 散 列 值 为 受 
限制 的 伪装 数据 ,在 观测 值 的 零 值 部 分 填充 散 列 值 已， 并 记录 
填充 的 位 置 ， 位 置 集合 用 RCPS 表示 。 本 文 定义 随机 函数 随机 
生成 值 域 范围 内 的 任意 值 作为 非 受 限制 的 伪装 数据 ， 定 义 不 受 
限制 的 伪装 数据 填充 观测 值 零 值 的 位 置 集合 为 RCPS 。 当 观测 
值 的 零 值 数 小 于 32 时 ， 受 限 的 伪装 数据 在 将 零 值 位 置 填充 满 
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数 , 是 把 任意 长 度 的 输入 
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之 后 ， 剩 下 的 受 限 伪装 数据 直接 放 在 观测 值 的 最 后 面 ， 当 观测 
值 的 零 值 数 大 于 等 于 32 时 ， 可 以 将 受 限 制 的 伪装 数据 全 部 填 
充 到 零 值 位 置 ， 并 根据 机 密 性 保护 需求 的 强度 ， 进 一 步 插入 相 
应 数量 的 非 受 限制 的 伪装 数据 。 一 般 情况 下 ， 感 知 数据 经 过 压 
缩 感知 后 零 值 数 较 多 ， 所 以 可 以 同时 将 受 限 制 的 伪装 数据 和 非 
受 限 制 的 伪装 数据 填充 到 观测 值 的 零 值 位 置 ， 增 强 对 感知 数据 
的 机 密 性 保护 。 
将 受 限制 的 伪装 数据 填充 到 观测 值 零 值 的 位 置信 息 RCPS 
和 非 受 限制 的 伪装 数据 填充 到 观测 值 零 值 的 位 置信 息 RCPS 共 
同 描述 为 伪装 数据 填充 到 观测 值 零 值 的 位 置 集合 GCPS ， 并 将 
GCPS 独立 、 加 密 地 传 给 汇聚 节点 。 同 时 ， GCPS 和 原始 感知 
数据 观测 值 的 位 置 集合 NTPS 共同 组 成 感知 隐私 数据 包 了 ， 即 


GCPS = RCPS + RCPS (6) 
(NTPS + RCPS + RCPS) c I (7) 
ARSCH E — x 388 fi 36. EL N IRL CREUSE. REA S S 


LS — M RS ARRETA HE H TEAR AARETE 
ME ACR A ERAI e np UL 75 25 rp CTS AAT AE E 
PERRE JHE IRIK REAC R A E 
不 同 ， 融 合 后 的 数据 可 以 经 过 一 跳 或 者 多 跳 传输 到 汇聚 节点 。 

在 实践 中 被 多 次 证 明 ， 对 感知 数据 进行 分 布 式 压缩 感知 与 直接 


对 感知 数据 进行 加 密 ， 在 隐私 保护 中 具有 类 似 的 效果 HMI。 感知 
数据 观测 及 插入 伪装 数据 的 过 程 如 图 1 所 示 。 
/("—-—-h- mmmm 
/ NE (BN h m dm 
| (Wa) Em m k k O 
KOD mo omi 
xS 
A "EL C mi 


A ee 
e ILI mm 


Il mio [ | 独立 稀疏 成 分 EN x doe c d 受 限 伪装 


图 1 感知 数据 观测 及 插入 伪装 数据 过 程 示意 图 
Fig.l Process of perceptual data observation and inserting disguised data 
2.3 ”感知 数据 的 融合 传输 

一 般 情 况 下 ， 感 知 数据 融合 计算 可 以 根据 实际 应 用 需要 选 
择 加 法 、 乘 法 、 求 平均 值 、 最 大 值 、 最 小 值 等 进行 综合 操作 。 
于 加 法 操作 在 隐私 保护 算法 中 限制 因素 较 少 ， 且 其 他 几 种 操 
作 也 都 可 以 转换 为 加 法 融合 的 形式 ， 本 文 在 感知 数据 融合 传输 
过 程 中 采用 加 法 操作 ， 加 法 操作 如 下 所 示 : 


Sum — y, t y; tty; (8) 


其 中 : y; 为 了 节点 对 原始 多 媒体 感知 数据 的 观测 值 插入 伪装 数 


据 之 后 的 值 。 
2.4 ”感知 融合 数据 的 完整 性 验证 
单 向 散 列 函数 验证 感知 数据 是 


否 完整 的 过 程 如 图 2 所 示 。 
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a) 融 合 节点 对 感知 数据 进行 压缩 观测 ， 利 用 单 向 散 列 函 数 
对 观测 值 求 取 散 列 值 AT ; 

b) 汇 聚 节点 在 收 到 隐私 数据 集 后 ， 根 据 收 到 的 插入 伪装 数 
据 的 位 置信 息 剔 除 伪装 数据 ， 对 观测 值 求 取 散 列 值 HO ; 

c) 比 较 两 个 散 列 值 ， 如 果 HO-HI, ， 说 明 感 知 数据 在 传输 
过 程 中 是 安全 的 ， 通 过 了 完整 性 验证 ， 下 一 步 进行 感知 数据 的 
重 构 ， 否 则 ， 说 明 数 据 在 传输 的 过 程 中 受到 了 攻击 ， 目 的 节点 


收 到 的 数据 并 不 是 真实 的 感知 数据 值 ， 将 之 丢弃 。 
融合 节点 | 汇聚 节点 
感知 数据 天) rae 
观测 值 隐私 数据 集 

DIE 
单 向 散 列 数据 
函数 ENAN 单 向 散 列 
"| a 
BUMBHI  ——-—HI-HO? ——— — 散 列 值 HO 


图 2 感知 数据 完整 性 验证 过 程 
Fig.2 Integrity verification of perceptual data 

2.5 ”感知 融合 数据 的 重 构 

对 通过 完整 性 验证 的 感知 融合 数据 进行 重 构 ， 恢 复出 原始 
感知 数据 。 记 分 布 式 压缩 感知 信息 算 子 为 4 -ow, NJ 
儿 =0O406=426。 文 献 [19] 指 出 ， 如 果 42s 能 够 满足 测量 矩 
阵 O E; Bii EAR EE V 不 相关 , 那么 2 可 以 通过 求解 最 优 范 数 
问题 精确 重 构 ， 重 构 如 下 所 示 : 


0; =argmin|| 9, llo 


st. y,- 49, (9) 


Hp: Ô 为 汇聚 节点 收 到 的 了 节点 的 感知 数据 通过 最 优化 方法 


求解 得 到 的 估计 值 ，9; 为 了 节点 感知 数据 的 稀疏 系数 ，yi 为 汇 
聚 节点 剔除 感知 数据 分 布 式 压缩 观测 值 中 的 伪装 数据 ， 并 经 过 
完整 性 检验 的 数据 。 

最 终 恢复 出 的 原始 感知 数据 X 为 


2 =Y Ê (10) 


J J 


2.6 ”基于 分 布 式 压 缩 感知 和 散 列 函数 的 数据 融合 隐私 保护 
算法 

在 上 述 理论 的 基础 上 ， 给 出 基于 分 布 式 压 缩 感知 和 散 列 函 
数 的 数据 融合 隐私 保护 算法 ， 以 达到 兼顾 群 智 感知 网 络 数据 融 
合 传输 过 程 中 对 感知 数据 的 机 密 性 保护 和 完整 性 保护 ， 同 时 减 
少数 据 融 合 传输 网 络 通信 量 的 目的 。 

基于 分 布 式 压缩 感知 和 散 列 函数 的 数据 融合 


斤 私 保护 算法 


分 布 式 压 缩 感知 方法 对 艇 内 感知 节点 采集 到 的 感知 
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数据 进行 稀疏 观测 。 
b) 利 用 单 向 散 列 函数 求 取 观测 值 的 散 列 值 HI. ,并 根据 不 同 
的 隐私 保护 需求 通过 随机 函数 生成 不 受 限 的 伪装 数据 ， 将 散 列 
值 和 不 受 限 的 伪装 数据 填充 在 观测 数据 的 零 值 位 置 形 成 隐私 数 
据 包 。 将 伪装 数据 的 填充 位 置 数据 单独 加 密 发 给 汇聚 点 。 
9 在 中 继 节点 处 进一步 完成 复 间 融合 ， 形 成 隐私 数据 集 。 
根据 融合 节点 距离 汇聚 节点 的 远近 不 同 ， 融 合 数据 可 经 过 一 跳 
或 多 跳 到 达 汇 聚 节点 。 
d) 汇 聚 节点 对 剔除 伪装 数据 的 隐私 数据 集中 的 感知 数据 求 
取 散 列 值 8O ， 比 较 两 个 散 列 值 是 否 相 等 ， 如 果 HOH, Yi 


明 数 据 在 传输 的 过 程 中 是 安全 的 ， 通 过 了 完整 性 检验 ， 对 感知 
数据 联合 重 构 出 原始 数据 ， 否则 ， 说 明 数 据 在 传输 的 过 程 中 发 
生 了 改变 ， 目 的 节点 收 到 的 数据 并 不 是 真实 值 ， 将 之 丢弃 。 
3 ”实验 结果 与 分 析 
3.1. 实验 环境 

本 文 算法 采用 MATLAB 实现 ， 仿 真 数 据 集 采用 标准 的 


Foreman, Hall Monitor 和 News 视频 序列 ， 三 个 视频 序列 的 长 
度 均 为 300 帧 ， 每 帧 图 像 的 分 辨 率 均 为 256 X256。 

为 了 测试 本 文 算法 的 性 能 ， 在 相同 条 件 下 ， 将 本 文 算法 
DAP-DCSHF 与 隐私 数据 融合 完整 性 检测 算法 ICKPDA 算法 、 
基于 分 布 式 压缩 感知 的 数据 融合 隐私 保护 算法 DCSPDA、 隐 私 
数据 完整 性 保护 算法 iPDA 进行 仿真 对 比 。 分 别 从 数据 机 密 性 
保护 水 平 、 数 据 完整 性 保护 水 平 、 通 信 消 耗 三 方面 评估 本 文 所 


提 算 法 的 有 效 性 。DAP-DCSHF 算法 在 仿真 中 的 参数 设置 如 表 
1 所 示 。 
表 1 算法 参数 设置 
Table 1 Algorithm parameter 
参数 值 参数 值 
网 络 面积 (m?) ”4500X3400 ”节点 缓存 M) 30 
Hash 值 长 度 
节点 通信 方式 Bluetooth 32 
(位 ) 
Foreman, Hall 每 个 视频 序列 帧 
视频 序列 300 
Monitor, News 数 ( 帧 ) 
图 像 帧 像素 256X256 链 路 破解 概率 0.1-0.5 
ERD 3-15 TER 30 
关键 帧 采样 率 0.7 非 关 键 帧 采样 率 0.3 


3.2 数据 机 密 性 保护 性 能 分 析 

为 了 客观 分 析 DAP-DCSHF 算法 对 感知 数据 融合 传输 过 程 
中 的 机 密 性 保护 效果 ， 假 设 向 真实 观测 数据 中 填充 的 散 列 值 和 
不 受 限 的 伪装 数据 的 位 置信 息 都 安全 、 保 密 的 传输 到 了 汇聚 节 
点 。 记 DAP-DCSHF 真实 感知 数据 集合 的 长 度 为 | NTPS | , 节点 
的 真实 感知 数据 稀 疏 成 分 与 受 限 伪 装 数据 组 成 的 节点 秘密 集合 
为 NSS ， 则 NSS 的 补 集 的 长 度 为 | NSS | 。 假 设 每 条 链 路 被 破解 
的 概率 为 9 ， 该 条 链 路 上 传输 的 感知 数据 被 泄露 的 概率 用 
Pap pcsur (Q 表示 。 泄露 概率 可 以 定义 为 当 给 定 链 路 被 破解 时 ， 


201811.00136v1 


chinaXiv 


攻击 者 能 从 截获 的 隐私 保护 数据 中 成 功 恢复 出 真实 感知 数据 的 


1 | NTPS |!| NSS |! 
DP R o — (NTPS|«[NSS i 
MEA RA REI A GARAT a C BEK AE E E 
AGE J REIRAS 1 AS VALE RU E. BOIE A RETE Ra 
HARON, DUE A RE CS ES TUR AE 
Probyy pcsup 可 以 表示 为 
Probus vog —Ü esce) | (2) 
在 DCSPDA NAP, Jii LR ACCRUE IH A Ro A 
JW. AGERET TCR TI a 336 8 f SI na HJ ERA c ER 
zr I BEC BARES US. HTA, DCSPDA 算法 簇 内 融合 
数据 隐私 泄露 概率 的 计算 与 DAP-DCSH 算法 类 似 。 
在 iPDA 算法 中 ， 每 个 感知 节点 首先 将 自己 感知 到 多 媒体 
数据 分 为 2 个 切片 ， 1 保留 其 中 一 片 ， 并 将 剩 下 的 2 元-1 片 
数据 分 发 给 邻居 节点 ， 同 时 ， 它 也 会 收 到 邻居 节点 发 来 的 n 个 
数据 分 片 。 攻 击 者 如 果 想 要 破解 感知 数据 ， 那 么 不 仅 需要 得 到 
该 节点 发 送出 去 的 2 元 -1 个 数据 分 片 ， 而 且 需 要 破解 邻居 节点 
发 来 的 n 个 数据 切片 的 链 路 ， 假 设 簇 内 感知 节点 数 为 nx ， 则 数 
据 草 到 泄露 概率 的 Proprm 可 以 表示 为 


P, 


DAP-DCSHF 


a1) 


Prob, =q V P(RecJ = k)q* (13) 
k=0 


Kp: P(RecJ =) 为 该 感知 节点 收 到 个 数据 切片 的 概率 。 若 
x 个 节点 收 到 个 切片 ， 则 

P(RecJ -k)2x/N (14) 
其 中 : WN 为 切片 总 数 ， 由 于 让 DA 算法 需要 构建 两 棵 融合 树 ， 
所 以 取 L=2， 那 么 N=3。 
在 ICKPDA 算法 中 , 攻击 者 只 有 把 节点 的 两 个 私密 种 子 和 
节点 的 度 链接 都 破解 ， 才 能 获得 隐私 数据 。 因 此 ， 隐 私 数据 遗 
到 泄露 的 概率 Probicxpp 可 以 表示 为 : 


Probes, = 4: 2 P(deg SK). q" (15) 


其 中 : n 为 艇 的 大 小 ，P(deg =k) 为 度数 为 k 的 节点 的 概率 。 
为 了 直观 地 体现 不 同 算法 在 感知 数据 传输 过 程 中 的 机 密 性 
保护 性 能 ， 本 文 在 簇 大 小 7 为 3 和 链 路 泄露 概率 4 为 0.1 且 采 
相同 原 图 片 帧 的 条 件 下 ， 对 不 同 算法 造成 数据 泄露 的 后 果 进 
行 仿真 ， 其 结果 如 图 3 所 示 。 在 采用 DAP-DCSHDF 算法 和 
DCSPDA 算法 时 , 泄密 的 感知 数据 并 不 能 完整 地 重 构 出 原始 的 
感知 图 像 帧 ， 而 采用 ICKPDA 和 iPDA 算法 时 ， 泄 圳 的 感知 数 
据 有 可 能 泄露 原始 感 测 图 像 的 部 分 视觉 特征 .本 文 提 出 的 DAP- 
DCSHDF 算法 相 较 于 其 他 算法 重 构 出 的 图 像 帧 较为 模糊 ， 说 明 
本 文 算法 泄露 的 原始 数据 量 较 少 ， 机 密 性 保护 效果 较 好 。 
DAP-DCSHF, DCSPDA, ICKPDA, iPDA 四 种 隐私 保护 数 
据 融 合算 法 在 簇 大 小 分 别 3、5、8 的 情况 下 ， 隐 私 数据 泄露 概 
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图 4 可 知 , 本 文 提出 的 算法 和 DCSPDA 算法 保护 感知 数 
据 机 密 性 的 性 能 明显 优 于 另外 两 种 算法 。 因 为 iPDA 和 ICKPDA 
两 种 算法 都 是 通过 采用 数据 切片 重组 的 方式 实现 数据 融合 机 密 
性 保护 ， 机 密 性 保护 效果 依赖 于 分 片 数 的 多 少 ， 如 果 增 加 分 片 
数 来 增强 数据 融合 的 机 密 性 保护 ， 那 么 同时 会 增 大 通信 开销 。 
而 DAP-DCSHF 和 DCSPDA 算法 都 是 基于 分 布 式 压缩 感知 对 
原始 感知 数据 进行 稀 疏 观测 ， 分 布 式 压缩 感知 的 测量 过 程 等 效 
于 隐私 数据 的 加 密 过 程 ， 而 且 两 种 算法 又 同时 在 稀 玻 观测 值 的 
零 值 部 分 填充 了 伪装 数据 ， 增 强 了 机 密 性 保护 。 同 时 ， 本 文 提 
出 的 DAP-DCSHF 的 机 密 性 保护 性 能 略 优 于 DCSPDA 算法 ， 
因为 DCSPDA 中 受 限 制 的 伪装 数据 的 取 值 范围 要 比 观 测 值 小 ， 
不 能 有 效 的 隐藏 真实 数据 ， 而 DAP-DCSHF 中 受 限 制 的 伪装 数 
据 为 散 列 值 ， 取 值 范围 并 没有 受到 观测 值 的 影响 。 


(a)Foreman 原 图 像 帧 
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图 3 四 种 算法 中 泄密 对 感知 数据 的 影响 
Fig.3 EFFect of leaks on perceived data in four algorithms 
3.3 ”数据 完整 性 保护 性 能 分 析 
DCSPDA 算法 增强 了 数据 融合 过 程 中 的 机 密 性 保护 ， 降 低 


率 情况 如 图 4 所 示 ， 为 了 减 小 偶然 因素 带 来 的 仿真 结果 误差 ， 
本 文 算法 中 的 仿真 值 取 10 次 仿真 结果 的 平均 值 。 


了 通信 开销 ， 但 是 针对 攻击 者 通过 重 放 、 伪 造 、 审 改 数据 等 威 
胁 感 知 数据 安全 的 行为 并 没有 提出 相应 的 解决 方案 。 本 文通 过 
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3.3.1 重 放 数 据 攻击 
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重 放 攻击 。DAP-DCSHF 算法 中 ， 
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中 ， 如 果 攻 击 者 只 在 其 中 一 棵 树 中 伪 
的 融合 结果 不 相等 ， 算 法 很 容易 能 够 
者 对 两 棵 融合 树 都 伪造 了 数据 包 ，1 
相等 
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点 收 到 的 观测 值 所 求 取 得 散 列 值 与 原 
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，iPDA 算法 不 能 检测 出 此 类 攻击 。 


| 
第 37 郑 da 
造 了 数据 包 ， 那 么 两 颗 树 
检测 出 来 。 但 是 如 果 攻 击 
于 两 棵 树 的 融合 结果 依然 


到 的 二 
后 ， 


元 数据 融合 值 也 都 
两 个 值 依 然 相 等 ， 所 
攻击 。DAP-DCSHEF 算 
剔除 伪装 数据 后 ， 汇 聚 节 
始 数据 观测 值 的 散 列 值 不 

ACH RAE, HMA, DAP- 


DCSHF 算法 可 以 有 效 抵抗 伪造 数据 包 攻 击 。 
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合 树 ， 最 后 再 将 重组 后 的 数据 包 发 送出 去 。 因 此 ，iPDA 算法 的 。 方案 数据 通信 和 量 又 太 高 、 保 护 强 度 较 弱 的 问题 ， 本 文 提 出 了 一 
数据 通信 开销 为 O(21+Dn)， 为 了 保护 数据 的 机 密 性 ， 必 须 使 种 基于 分 布 式 压缩 感知 和 散 列 函数 的 数据 融合 隐私 保护 算法 
1>2， 因 此 ， 该 算法 的 数据 通信 开销 至 少 为 0(5n) . DAP-DCSHF。 该 算法 采用 分 布 式 压缩 感知 方法 对 感知 数据 进 
在 ICKPDA 算法 数据 融合 阶段 , 节点 首先 将 数据 分 为 1 片 ， ” 行 稀 疏 观 测 ， 去 除 匈 余数 据 ， 采 用 单 向 散 列 函数 求 取 感知 数据 
自己 存储 其 中 一 片 ， 其 余 的 1-1 片 数据 加 密 后 分 别 发 送 给 不 同 。 观测 值 的 散 列 值 ， 将 散 列 值 作为 受 限 伪 装 数据 和 根据 感知 数据 
的 邻居 节点 ， 邻 居 节 点 收 到 数据 切片 后 ， 先 解密 再 与 自身 的 数 。” 机 密 性 保护 需求 的 强度 由 随机 函数 生成 的 不 受 限制 的 伪装 数据 
据 进 行 融合 ; 同时 , 该 节点 也 会 收 到 其 他 节点 发 来 的 数据 分 片 ， 一 起 填充 到 感知 数据 观测 值 的 零 值 部 分 ， 形 成 隐私 数据 包 ， 增 
与 自己 的 男 一 个 数据 分 片 进 行 融合 。 最 后 ， 所 有 节点 都 进行 循 。 强 感 知 数据 的 机 密 性 保护 。 数 据 经 过 加 性 融合 形成 隐私 数据 集 

再 


环 融 合 之 后 ， 上 传 融 合 数据 到 上 层 节点 。 由 于 分 片 数 1 必须 大 传输 到 汇聚 节点 ， 在 汇聚 节点 对 隐私 数据 集 吻 除 伪装 数据 ，] 
于 等 于 2， 所 以 该 算法 的 通信 开销 至 少 为 On) 。 次 求 取 散 列 值 验证 感知 数据 的 完整 性 ， 对 通过 完整 性 验证 的 观 
为 了 合理 比较 四 种 算法 的 性 能 ， 将 相同 数量 的 感知 数据 传 。 测 值 通过 重 构 恢复 出 原始 感知 数据 。 通 过 与 隐私 数据 融合 完 
输 到 汇聚 节点 ， 比 较 四 种 算法 的 总 数据 通信 量 〈 数 据 包 数 ) ， 性 保护 保护 算法 ICKPDA、 基 于 分 布 式 压缩 感知 的 隐私 保护 数 
仿真 结果 如 图 5 所 示 。 据 融 合算 法 DCSPDA、 兼 顾 完 整 性 和 机 密 性 保护 的 算法 PDA 


对 比 ， 本 文 所 提 算 法 的 机 密 性 保护 性 能 均 优 于 三 种 算法 ， 在 防 
止 攻击 者 伪造 、 窜 改 数据 的 完整 性 保护 性 能 中 均 优 于 其 他 三 种 
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NL -E 算法 ;在 防止 重 放 数据 攻击 中 ， 保 护 性 能 略 差 于 PDA 算法 ; 
E n 在 降低 通信 能 耗 方面 ， 本 文 所 提 算 法 明显 优 于 ICKPDA, iPDA 
Md ao 算法 ， 当 数据 量 较 小 时 , 本文 算 法 的 通信 量 略 高 于 DCSPDA 算 
: n 法 ， 但 是 随 着 簇 节点 的 增多 ， 两 种 算法 的 通信 和 量 趋 近 于 一 致 。 
200 本 文 算法 兼顾 了 数据 机 密 性 和 完整 性 保护 ， 同 时 大 大 减少 了 网 
0 络 中 的 通信 开销 ,在 实际 应 用 中 具有 很 强 的 适用 性 和 可 扩展 性 。 
icai 当然 ， 该 算法 也 存在 一 些 不 足 ， 例 如 本 文 仅 适用 于 单一 场景 
图 5 ”通信 开销 性 能 感知 数据 融合 隐私 保护 问题 ， 但 是 在 实际 应 用 中 ， 智 能 设备 集 
Fig.5 Communication overhead 成 的 传感器 种 类 越 来 越 多 ， 考 虑 这 种 更 复杂 场景 下 的 感知 数据 
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